Skip to content

오늘은 2일차.

어제 짠 구조를 다시 보면서 이것저것 돌려봤는데, 뭔가 좀 부족했다.
특히 planner 쪽에서 부족함을 많이 느꼈다.

1일차 설계대로 한번 진행해보려고 codex를 불렀다.
사람들은 claude code가 좋다고 많이 말하는데, 나는 아무리 써봐도 codex가 더 일을 잘하는 것 같다...

물론 claude가 잘하는 것도 있다.
다이어그램이나 뭔가 눈에 보이는 결과물은 확실히 잘 내는 느낌이다.
근데 코드 작성이나 문서 쪽으로 가면 은근히 놓치는 게 많이 보였다.

아, 그리고 아이디어 구상은 또 claude가 좋다.
티키타카가 잘 되는 느낌?
방향 제시는 잘해준다.

굳이 비유하자면 이런 느낌이다.

  • claude: 친한 IT 스타트업 리더 느낌
  • codex: 실무 개발팀 선임 느낌

아무튼 이번에는 GPT와 Claude를 조합해서 PRD와 기술 스택 문서를 먼저 작성했다.
그리고 이 두 문서를 기반으로 todo checklist를 만들어달라고 했다.

엥?
PRD의 주요 요구사항들이 꽤 많이 빠져 있었다.

안돼. 이러면 안돼~

지금 내 설계에서는 planner가 혼자 한 번 요청하고 끝나는 구조라서,
중간에 피드백 단계가 없다.
그러니까 여기서 부실한 계획서가 나오면 뒤에 개발이 진행될수록 난리 부르스를 칠 게 너무 뻔하다.

그래서 아예 구조를 바꾸기로 했다.
그냥 planner 하나로 가는 게 아니라, 팀으로 나누기로 했다.

  • planner_team
  • developer_team

그리고 컨텍스트도 한 번에 너무 많이 물고 가지 않게,
step by step으로 나눠서 진행하는 방식으로 가기로 했다.

현재 생각한 플로우는 이렇다.

text
user_request
 -> intake_router
 -> job_initializer
 -> planner_team(subgraph)
    -> context_collector
    -> plan_writer (codex sdk)
    -> coverage_reviewer
        -> approved -> human_gateway
        -> needs_revision -> plan_writer
 -> step_dispatcher
 -> developer_team(subgraph)
    -> step_initializer
    -> context_builder
    -> developer (codex sdk)
    -> verifier
    -> qa_reviewer
        -> approved -> step_finalizer
        -> needs_revision -> developer
        -> plan_invalid -> planner_team
        -> blocked -> human_gateway
 -> step_dispatcher (loop)
 -> job_finalizer

이제는 한 번에 크게 던지고 끝내는 게 아니라, 단계를 나눠서 흘려보내고, 필요한 만큼 다시 돌리고, 마지막에 정리하는 구조로 가는 셈이다.

뭔가 이 프로젝트 자체가 재귀적으로 발전하는 느낌이라 웃기다 ㅋㅋㅋ 잘하는 에이전트 팀을 만들기 위해, 지금 내가 쓰고 있는 에이전트들을 더 잘 활용하는 방법을 고민하고, 그 고민의 결과를 다시 이 프로젝트에 반영하고 있으니 말이다.

재밌다!